Serengeti - Webbasierte Annotation semantischer Relationen
نویسندگان
چکیده
Der Artikel stellt zum einen ein Annotationsschema für semantische Relationen vor, das für die Beschreibung eines deutschsprachigen Korpus für Training und Evaluation eines Systems zur Anaphernauflösung entwickelt wurde, zum anderen wird das webbasierte Annotationstool Serengeti beschrieben, das zur Annotation anaphorischer Relationen im Projekt A „Sekimo“ eingesetzt wird. Im Gegensatz zu anderen Annotationstools benötigt Serengeti keine lokale Installation, was den Einsatz an einer großen Anzahl von Rechnern erleichtert. Darüber hinaus implementiert Serengeti ein Mehrbenutzerkonzept, das sowohl Gruppen als auch einzelne Nutzer unterstützt und zugehörige Dateien und Annotationen verwaltet.
منابع مشابه
Generierung semantischer Felder auf der Basis von Frei-Texten
den Anspruch, genau die gleichen Head/ModifierRelationen automatisch zu finden, wie durch menschliche Intuition. Auf die RelationenTypes bezogen müßte die Fehlerrate wesentlich kleiner sein, wenn nur die häufigen Head/Modifier-Relationen berücksichtigt werden. Die Behandlung der Konjunktionsrelationen (s. Abb. 3) wurden ebenfalls zum Zweck der Phrasennormalisierung entwickelt. Bei der Extraktio...
متن کاملWeb-based Annotation of Anaphoric Relations and Lexical Chains
Annotating large text corpora is a timeconsuming effort. Although single-user annotation tools are available, web-based annotation applications allow for distributed annotation and file access from different locations. In this paper we present the webbased annotation application Serengeti for annotating anaphoric relations which will be extended for the annotation of lexical chains.
متن کاملDie Verwendung von GermaNet zur Pflege und Erweiterung des Computerlexikons HaGenLex
Dieser Beitrag soll am Beispiel des semantikbasierten Computerlexikons HaGenLex aufzeigen, wie GermaNet für die Pflege und Erweiterung anderer lexikalisch-semantischer Ressourcen eingesetzt werden kann. Ausgangsbasis ist dabei eine Lesartenzuordnung zwischen GermaNetund HaGenLexEinträgen, welche die Übertragung der sinnrelationalen Zusammenhänge von GermaNet auf HaGenLex erlaubt. Auf der Grundl...
متن کاملLinguistische und semantische Annotation eines Zeitungskorpos
Zusammenfassung. Dieser Artikel beschreibt das Vorgehen beim automatischen inkrementellen Aufbereiten eines rohen Textkorpus mit linguistischer und semantischer Information. Es wird gezeigt, wie das Erkennen von Eigennamen hilft, die Wortartenkategorisierung und partielle syntaktische Analysen zu verbessern. Eine Evaluation über ca. 1’000 Sätze zeigt die Stärken und Schwachpunkte der verschiede...
متن کاملRelationsextraktion durch Frequent Patterns in Dependency Graphen
Die Anzahl der Veröffentlichungen im biomedizinischen Sektor wächst exponentiell. Dies macht Verfahren notwendig, in der großen Menge von Publikationen (man spricht dabei von einem Korpus) relevante Informationen automatisch zu finden. Eine wichtige Aufgabe ist die Extraktion von Relationen zwischen biomedizinischen Entitäten. Typische Entitäten sind Proteine, Gene und Krankheiten und wichtige ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- JLCL
دوره 23 شماره
صفحات -
تاریخ انتشار 2008